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(57) Abstract 

The invention concerns 
an arrangement for the 
voice actuation of systems 
and apparatus by means 
of commands influencing 
the system or apparatus 
operation. According to 
the invention, some of the 
entirety of commands available 
are displayed on a display 
device as a function of the 
particular operating state, 
an input being effected by 
pronouncing one of the 
commands displayed in each 
case. A memory is provided 
for storing voice signals 
received via a microphone 
or signals derived therefrom. 
The stored signals are 
compared with voice-relevant 
signals corresponding to the 
commands displayed. Those 
commands for which the 
comparison result is positive 
are accepted as being selected. 




(57) Zusammenfassung 

Bci cincr Einrichtung zur Sprachsteucrung von Anlagcn und Geraten. mit Hilfc von den Bctricb dcr Anlagc oder des Gcratcs 
beeinflussenden Befehlen, wird auf cincr Anzeigevorrichtung in Abhangigkeit vom jcwciligen Bctriebszustand cin Tcil dcr insgesamt 
vorgcschcncn Bcfchlc dargestellt, wobci cine Eingabc durch Aussprache jewcils eincs der dargestelltcn Befchle erfolgt Ein Speicher ist zur 
Spcicherung von jewcils Uber ein Mikrofon empfangenen Sprachsignalen oder davon abgeleiteter signale vorgesehen. Die gespeichcrten 
Signale werden mit sprachrclevantcn Signalen verglichen, welche den jewcils dargestelltcn Befehlen entsprechen. Derjcnige Befehl, bei 
welchem dcr Vcrglcich positiv ausfallt, wird als ausgcwahlt angenommen. 
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Einrichtung zur Sprachsteuerung von Anlagen und Geraten 

Die Erfindung betrifft eine Einrichtung zur Sprachsteuerung von 
Anlagen und Geraten mit Hilfe von den Betrieb der Anlage oder 
des Gerates beeinf lussenden Befehlen. 

Zur Steuerung von Anlagen und Geraten werden in zunehmendem Mafie 
Spracheingaben verwendet, wobei uber ein Mikrofon aufgenommene 
Befehle des Benutzers mit Hilfe von Spracherkennungsverf ahren 
erkannt werden. Hierbei wird zwischen sprecherabhangigen und 
sprecherunabhangigen Spracherkennungsverf ahren unterschieden, 
wobei die sprecherabhangige Spracherkennung einen begrenzten, 
festen Befehlssatz aufweist, der durch den Benutzer trainiert 
werden raufi. Dazu wird in einer Lernphase jeder Befehl durch den 
Benutzer mehrmals wiederholt, damit sich die 
Spracherkennungseinrichtung auf die Phonetik des Benutzers 
einstellen kann. 

Die sprecherunabhangige Spracherkennung arbeitet ebenfalls mit 
einem begrenzten, fest definierten Befehlssatz, wobei allerdings 
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das Spracherkennungsverfahren so "intelligent" ist, dafc kein 
Training mehr erforderlich ist. 

Beiden Verfahren ist gemeinsam, dafi nur ein begrenzter, fest 
vorgegebener Bef ehlsvorrat erkannt werden kann. Diesen mufi der 
Benutzer in der Regel auswendig lernen. Je grofcer die Anzahl der 
Befehle ist, je hohere Anf orderungen werden an das 
Spracherkennungsverfahren und an das Gedachtnis des Benutzers 
gestellt . 

Diese Nachteile der bekannten Spracherkennungsverfahren 
erschweren die Sprachsteuerung beispielsweise eines Autoradios 
besonders stark. Bei diesen Geraten ist namlich die Anzahl der 
erf orderlichen Befehle relativ grofc, unter anderem durch die 
Vielzahl der Sender, auf die ein Autoradio, insbesondere wahrend 
einer langeren Fahrt, einzustellen ist. 

Aufgabe der vorliegenden Erfindung ist es, eine Einrichtung zur 
Sprachsteuerung von Anlagen und Geraten unter Vermeidung der 
obengenannten Nachteile vorzuschlagen, insbesondere dem Benutzer 
ein Auswendiglernen vieler Befehle zu ersparen. 

Diese Aufgabe wird erf iridungsgemaE dadurch gelost, dafi auf einer 
Anzeigevorrichtung in Abhahgigkeit vom jeweiligen 
Betriebszustand ein Teil der insgesamt vorgesehenen Befehle 
dargestellt wird, wobei eine Eingabe durch Aussprache jeweils 
eines der dargestellten Befehle erfolgt, dafi ein Speicher zur 
Speicherung von jeweils uber ein Mikrofon empfangenen 
Sprachsignalen oder davon abgeleiteter Signale vorgesehen ist, 
daft die gespeicherten Signale mit sprachre levant en Signalen, 
welche den jeweils dargestellten Befehlen entsprechen, 
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verglichen werden und dafi derjenige Befehl, bei welchem der 
Vergleich positiv ausfallt, als ausgewahlt angenommen wird. 

Die erf indungsgemafce Einrichtung hat einerseits den Vorteil, da£ 
dem Benutzer angezeigt wird welche Befehle bei dem jeweils 
vorhandenen Betriebszustand der Anlage und des Gerates 
eingegeben werden konnen. Dabei ist nicht nur die Auswahl als 
solche von Vorteil, sondern auch die Sichtbarmachung der 
einzelnen Befehle, wodurch der Benutzer gehalten wird, die 
vorgegebenen Worter zu verwenden. So wird beispielsweise die 
versehentliche Benutzung eines fur das Spracherkennungs system 
nicht erkennbaren Synonyms durch den Benutzer vermieden. 
Andererseits hat die erf indungsgemafce Einrichtung den Vorteil, 
daS die Spracherkennungseinrichtung die empfangenen 
Sprachsignale trotz einer grofcen Anzahl von insgesamt moglichen 
Befehlen nur mit jeweils wenigen im Menu dargestellten Befehlen 
vergleichen mu£. Dadurch kann ein einf aches und sicheres 
Spracherkennungsverf ahren gewahlt werden. 

Eine Wei terbildung der erf indungsgemafcen Einrichtung besteht 
darin, dafi die sprachrelevanten Signale durch Sprachsynthese der 
jeweils dargestellten Befehle erzeugt und in einem weiteren 
Speicher abgelegt werden. Dieses hat den Vorteil, daB der 
Hersteller der Anlagen und Gerate und gegebenenf alls auch der 
Benutzer bei Anderungen der Bef ehlsauswahllisten (Menus) bzw. 
der einzelnen Befehle neue Befehle lediglich in Form von Text, 
beispielsweise sogenannten ASCI-Zeichen, eingeben kannZ die dann 
in die zu vergleichenden sprachrelevanten Signale umgewandelt 
werden. 

Bei der erf indungsgemafien Einrichtung kann ferner vorgesehen 
sein, dafi der Speicher und der weitere Speicher Analogspeicher 
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sind und dafc der Vergleich mit Analogs ignalen erfolgt oder dafi 
der Speicher und der weitere Speicher digitale Speicher sind und 
da£ der Vergleich mit digitalen Signalen erfolgt. 

Je nach Voraussetzungen im einzelnen kann auch eine 
Ausfuhrungsf orm vorteilhaf ter sein, die darin besteht, dafi die 
zu vergleichenden sprachrelevanten Signale aller insgesamt 
vorgesehenen Bef ehle in einem Speicher abgelegt sind und dafi der 
Zugriff auf den Speicher zu Zwecken-des Vergleichs entsprechend 
den jeweils dargestellten Befehlen gesteuert wird. 

Eine weitere vorteilhafte Ausgestaltung der erf indungsgemafcen 
Einrichtung besteht darin, dafi die sprachrelevanten Signale die 
Grundmodulation beim Sprechen des jeweiligen Befehls darstellen. 
Hierdurch ist ein einfacher Vergleich der gespeicherten mit den 
sprachrelevanten Signalen moglich. 

Ein Ausfuhrungsbeispiel der Erfindung ist in der Zeichnung 
dargestellt und in der nachf olgenden Beschreibung naher 
erlautert . 

Bei dem dargestellten Ausfuhrungsbeispiel wird mit einer 
erf indungsgemafien Einrichtung ein Autoradio sprachgesteuert , das 
schematisch durch einen Empfangsteil 1 mit einer Antenne 2, 
einen Signalverarbeitungsteil 3, zwei Endstufen 4, 5 und 
Lautsprecher 6, 7 dargestellt ist. Der Signalverarbeitungsteil 3 
kann in an sich bekannter Weise beispielsweise einen 
Stereodecoder, einen Radio-Datensignal -Decoder , einen 
Verkehrsfunkdecoder sowie Lautstarke- und Klangsteller 
enthalten. 
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Das Empfangsteil 1 und das Signalverarbeitungsteil 3 werden von 
einem Mikrocomputer 8 gesteuert, der von dem 
Signalverarbeitungsteil 3 auch verschiedene Daten, wie 
beispielsweise decodierte Radio-Datensignale erh&lt. Ein Ausgang 
des Mikrocomputers 8 ist mit einer Anzeigevorrichtung (Display) 
9 verbunden, die ein Menu mit den im jeweiligen Betriebszustand 
des Autoradios ausfuhrbaren Befehlen zeigt . Dieses kann 
beispielsweise eine Liste von Einstellungen wie "{Cassette" , 
"UKW" "Mittelwelle", "Verkehrsfunk" oder eine Auswahl der jweils 
zu empfangenden Sender sein. Bei bekannten Eingabeeinrichtungen, 
die nicht sprachgesteuert sind, wird die Einstellung eines der 
Sender durch einen Druck auf eine Taste, die neben dem Namen des 
Senders angeordnet ist, bewirkt. 

Bei der erf indungsgemafien Einrichtung zur Sprachsteuerung ist 
ein Mikrofon 10. vorgesehen, dessen Ausgangssignale uber einen 
Verst&rker 11 einem Speicher 12 zugefuhrt werden. Aufcer der 
Anzeigevorrichtung 9 ist an dem Mikrocomputer 8 ein 
Sprachcodierer 13 angeschlossen, dessen Ausgangssignale 
synthetische Sprachsignale darstellen und in einen Speicher 14 
einschreibbar sind. Verfahren zur Sprachcodierung sind an sich 
bekannt, beispielsweise durch das Computerprogramm SAY fur den 
Computer Amiga. Die Inhalte der Speicher 12 und des Speichers 14 
konnen in einer Vergleichseinrichtung 15 verglichen werden. 
Stimmt eines der im Sprachcodierer 13 erzeugten Signale mit dem 
im Speicher 12 vorhandenen Signal uberein - einschliefilich eines 
Toleranzbereichs - wird dem Mikrocomputer 8 gemeldet, welches 
der sprachrelevanten Signale, das heifct, welcher Befehl aus dem 
dargestellten Menu, mit dem eingegebenen Befehl ubereinstimmt . 
Die entsprechende Funktion wird dann vom Mikrocomputer 8 
ausgefuhrt. 
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Danach kann dann gegebenenf alls ein anderes Menu mit Hilfe der 
Anzeigevorrichtung 9 sichtbar gemacht werden, wobei die im Menu 
aufgefuhrten Daten dem Sprachcodierer 13 zugefuhrt werden, 
worauf eine neue Spracheingabe moglich ist. 
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Ansp ruche 

1. Einrichtung zur Sprachsteuerung von Anlagen und Geraten, mit 
Hilfe von den Betrieb der Anlage oder des Gerates 

beeinf lussenden Befehlen, dadurch gekennzeichnet , dafi auf einer 
Anzeigevorrichtung (9) in Abh&ngigkeit vom jeweiligen 
Betriebszustand ein Teil der insgesamt vorgesehenen Befehle 
dargestellt wird, wobei eine Eingabe durch Aussprache jeweils 
eines der dargestellten Befehle erfolgt, daS ein Speicher (12) 
zur Speicherung von jeweils uber ein Mikrofon (10) erapfangenen 
Sprachsignalen oder davon abgeleiteter Signale vorgesehen ist, 
daS die gespeicherten Signale mit sprachrelevanten Signalen, 
welche den jeweils dargestellten Befehlen entsprechen, 
verglichen werden und da£ derjenige Befehl, bei welchem der 
Vergleich positiv ausfallt. als ausgew&hlt angenommen wird. 

2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daB die 
sprachrelevanten Signale durch Sprachsynthese der jeweils 
dargestellten Befehle erzeugt und in einem weiteren Speicher 
(14) abgelegt werden. 

3. Einrichtung nach Anspruch 2, dadurch gekennzeichnet, da£ der 
Speicher (12) und der weitere Speicher (14) Analogspeicher sind 
und da£ der Vergleich mit Analogsignalen erfolgt. 
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4. Einrichtung nach Anspruch 2, dadurch gekennzeichnet , dafc der 
Speicher (12) und der weitere Speicher (14) digitale Speicher 
sind und dafi der Vergleich mit digitalen Signalen erfolgt. 

5. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, dafi die 
zu vergleichenden sprachrelevanten Signale aller insgesamt 
vorgesehenen Befehle in einem Speicher abgelegt sind und da£ der 
Zugriff auf den Speicher zu Zwecken des Vergleichs entsprechend 
den jeweils dargestellten Befehlen gesteuert wird. 

6. Einrichtung nach einem der Anspruche 1 bis 5, dadurch 
gekennzeichnet, daS die sprachrelevanten Signale die 
Grundmodulation beim Sprechen des jeweiligen Befehls darstellen. 
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